Analyse de données avec python

Evolution des prestations de 2008 à 2010 et la répartition spatiale de structures sociales en cote d'ivoire

In [36]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data_1=pd.read_csv("cnps_2.csv")
data_1.head()
#data_1.dtypes
#print(data_1) 
Out[36]:
Prefecture Nbre_de_structure Nbre_de_service
0 ABENGOUROU 5 1.396648
1 ABIDJAN 106 29.608939
2 ABOISSO 14 3.910615
3 ADIAKE 2 0.558659
4 ADZOPE 6 1.675978

L'aperçu des données.

In [48]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_2=pd.read_json("Lim_pref.json")
data_2.head()
#print(data_2.shape)
Out[48]:
type features
0 FeatureCollection {'type': 'Feature', 'properties': {'DEPARTMNT'...
1 FeatureCollection {'type': 'Feature', 'properties': {'DEPARTMNT'...
2 FeatureCollection {'type': 'Feature', 'properties': {'DEPARTMNT'...
3 FeatureCollection {'type': 'Feature', 'properties': {'DEPARTMNT'...
4 FeatureCollection {'type': 'Feature', 'properties': {'DEPARTMNT'...
In [ ]:
### L'aperçu des données.
In [61]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_3=pd.read_csv("imma.csv")
data_3.head()
Out[61]:
Effectif Annee Rubrique
0 17470 2008 Employeurs
1 483695 2008 Salaries
2 19940 2009 Employeurs
3 485478 2009 Salaries
4 21872 2010 Employeurs

L'aperçu des données.

In [63]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_3=pd.read_csv("presta.csv")
data_3.head()
Out[63]:
Rubrique Effectif Annee
0 Effectif des bénéficiaires de prestations fami... 54637 2008
1 Effectif des bénéficiaires de rentes d'acciden... 11795 2008
2 Effectif des bénéficiaires de l'assurance vie... 97044 2008
3 Effectif des bénéficiaires de prestations fami... 52530 2009
4 Effectif des bénéficiaires de rentes d'acciden... 11799 2009

L'aperçu des données.

In [38]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_4=pd.read_csv("empl.csv")
sns.set_context("notebook",rc={"xtick.labelsize":  
15,"ytick.labelsize": 15}) 
plt.figure(figsize=[15,6]) 
plt.subplot(111) 
#donnees_summer=datasuppp[datasuppp 
#["Season"]=="Summer"] 
#donnees_pointplot=donnees_summer.groupby(["Year","Sex"]).size().reset_index(name="Count") 
sns.pointplot(x ="Annee", y="Effectif", data = data_4, 
hue="Rubrique") 
plt.xticks(rotation=90) 
plt.show()

L'évolution des employeurs CNPS de 2008 à 2010.

Le nombre des employeurs est passés de 17 000 à 22 000

In [72]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_4=pd.read_csv("salar.csv")
sns.set_context("notebook",rc={"xtick.labelsize":  
15,"ytick.labelsize": 15}) 
plt.figure(figsize=[15,6]) 
plt.subplot(111) 
#donnees_summer=datasuppp[datasuppp 
#["Season"]=="Summer"] 
#donnees_pointplot=donnees_summer.groupby(["Year","Sex"]).size().reset_index(name="Count") 
sns.pointplot(x ="Annee", y="Effectif", data = data_4, 
hue="Rubrique") 
plt.xticks(rotation=90) 
plt.show()

L'évolution des salariés CNPS de 2008 à 2010.

Une évolution très timide entre 2008 et 2009 et une forte évolution entre 2009 et 2010.

In [64]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_4=pd.read_csv("imma.csv")
sns.set_context("notebook",rc={"xtick.labelsize":  
15,"ytick.labelsize": 15}) 
plt.figure(figsize=[15,6]) 
plt.subplot(111) 
#donnees_summer=datasuppp[datasuppp 
#["Season"]=="Summer"] 
#donnees_pointplot=donnees_summer.groupby(["Year","Sex"]).size().reset_index(name="Count") 
sns.pointplot(x ="Annee", y="Effectif", data = data_4, 
hue="Rubrique") 
plt.xticks(rotation=90) 
plt.show()
In [75]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_4=pd.read_csv("mifa.csv")
sns.set_context("notebook",rc={"xtick.labelsize":  
15,"ytick.labelsize": 15}) 
plt.figure(figsize=[15,6]) 
plt.subplot(111) 
#donnees_summer=datasuppp[datasuppp 
#["Season"]=="Summer"] 
#donnees_pointplot=donnees_summer.groupby(["Year","Sex"]).size().reset_index(name="Count") 
sns.pointplot(x ="Annee", y="Effectif", data = data_4, 
hue="Rubrique") 
plt.xticks(rotation=90) 
plt.show()

L'évolution de prestations familiales de 2008 à 2010.

On constate une legère baisse des prestations familiales de 2008 à 2009, cela s'explique par.... , suivi d'une forte augmentation de 2009 à 2010 ceci est du....

In [74]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_4=pd.read_csv("retraite.csv")
sns.set_context("notebook",rc={"xtick.labelsize":  
15,"ytick.labelsize": 15}) 
plt.figure(figsize=[15,6]) 
plt.subplot(111) 
#donnees_summer=datasuppp[datasuppp 
#["Season"]=="Summer"] 
#donnees_pointplot=donnees_summer.groupby(["Year","Sex"]).size().reset_index(name="Count") 
sns.pointplot(x ="Annee", y="Effectif", data = data_4, 
hue="Rubrique") 
plt.xticks(rotation=90) 
plt.show()
In [73]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_4=pd.read_csv("retraite.csv")
sns.set_context("notebook",rc={"xtick.labelsize":  
15,"ytick.labelsize": 15}) 
plt.figure(figsize=[15,6]) 
plt.subplot(111) 
#donnees_summer=datasuppp[datasuppp 
#["Season"]=="Summer"] 
#donnees_pointplot=donnees_summer.groupby(["Year","Sex"]).size().reset_index(name="Count") 
sns.pointplot(x ="Annee", y="Effectif", data = data_4, 
hue="Rubrique") 
plt.xticks(rotation=90) 
plt.show()

L'évolution de prestations retraites de 2008 à 2010.

On constate une baisse de 3% des bénéficiaires émis de la retraite de 2008 à 2009 en raison de nombreuses suspensions de droits opérés pour non dépôt par les assurés de pièces de régularisation périodique (certificats de vie, certificats de non remariage etc.)

In [65]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data_4=pd.read_csv("presta.csv")
sns.set_context("notebook",rc={"xtick.labelsize":  
15,"ytick.labelsize": 15}) 
plt.figure(figsize=[15,6]) 
plt.subplot(111) 
#donnees_summer=datasuppp[datasuppp 
#["Season"]=="Summer"] 
#donnees_pointplot=donnees_summer.groupby(["Year","Sex"]).size().reset_index(name="Count") 
sns.pointplot(x ="Annee", y="Effectif", data = data_4, 
hue="Rubrique") 
plt.xticks(rotation=90) 
plt.show()
In [35]:
import os
import numpy as np 
import pandas as  pd

import folium

#url = 'https://raw.githubusercontent.com/python-visualization/folium/master/examples/data'
state_geo = 'Lim_pref.json'
state_unemployment = 'cnps_2.csv'
state_data = pd.read_csv(state_unemployment)

m = folium.Map(location=[7.860367, -5.481547], zoom_start=7)

folium.Choropleth(
    geo_data=state_geo,
    name='Nombre de structures sociales par sousprefecture',
    data=state_data,
    columns=['Prefecture','Nbre_de_service'],
    #color_data = data.set_index(columns[Prefecture])[columns[Nbre_de_service]].to_dict()
    key_on='properties.DEPARTMNT',
    fill_color='PuRd',
    fill_opacity=0.7,
    line_opacity=0.2,
    legend_name='Nombre de structures sociales (%)'
).add_to(m)

folium.LayerControl().add_to(m)
(m)
Out[35]:
Make this Notebook Trusted to load map: File -> Trust Notebook

Répartition spatiale des structures de protections sociales

Cette carte met en evidence la disparité spatiale des structures de protections entre les sous-prefectures. 30 % des structures de protections sociales se situent dans la sous-prefecture d'Abidjan (en rouge). Certaines sous-prefectures ne possedent aucune struture (en noire).